Extraction de motifs fermés dans des relations n-aires bruitées
نویسندگان
چکیده
La fouille de relations binaires a été très étudiée via notamment les usages multiples des ensembles fermés fréquents. Cependant, il est courant que les données à traiter se représentent dans des relations n-aires avec n ≥ 3 et il semble donc naturel de vouloir étendre le calcul de motifs fermés dans ce contexte (Ji et al., 2006; Jaschke et al., 2006; Cerf et al., 2008b). Dans le cas des relations binaires (calcul de 2-ensembles fermés ou concepts formels selon (Ganter et al., 2005)), nous savons que le nombre et la qualité des motifs extraits sont déjà problématiques. De nombreuses raisons (e.g., une erreur de mesure) peuvent mener à l’absence d’un couple dans la relation et un « véritable » motif donne lieu à plusieurs motifs fermés distincts et plus petits : quand la quantité de bruit augmente, le nombre de motifs fermés explose et leur pertinence se dégrade. Cette situation empire dramatiquement lorsque l’arité de la relation à fouiller augmente. Nous introduisons ici un algorithme de calcul de tous les motifs fermés ayant un nombre borné d’exceptions par élément (de n’importe quel attribut) sur n’importe quelle relation n-aire. Cet article est une version courte de (Cerf et al., 2008a).
منابع مشابه
Extraction de motifs n-aires utilisant la PPC
Dans cet article, nous proposons une approche PPC permettant d’extraire des motifs n-aires (i.e. combinant plusieurs motifs locaux) en fouille de données. Dans un premier temps, l’utilisateur modélise sa requête à l’aide de contraintes portant sur plusieurs motifs locaux. Puis, un solveur de contraintes génère l’ensemble correct et complet des solutions. Notre approche permet de modéliser de ma...
متن کاملDescription structurelle automatique de documents musicaux
Une nouvelle méthodologie d’extraction de motifs répétés au sein de partitions musicales est présentée. L’automatisation de la recherche de répétitions permet un approfondissement de l’analyse musicale, et rend possible la conception d’outils de gestion des masses de données musicales. L’approche proposée consiste en une explicitation des facteurs de redondance structurelle sousjacents à une te...
متن کاملExtraction de motifs séquentiels. Problèmes et méthodes
SYNOPSIS. Dans un premier temps, le problème de l’extraction de motifs séquentiels peut sembler proche de celui de l’extraction de règles d’association. Ce rapprochement s’avère cependant très fragile en raison d’un élément clé qui est propre à l’extraction de motifs séquentiels : la temporalité. Cette notion permet à la fois de distinguer à l’intérieur des enregistrements un ordre d’apparition...
متن کاملExtraction de concepts sous contraintes dans des données d'expression de gènes
L’une des activités les plus importantes en biologie est l’analyse des données d’expression de gènes. Les biologistes espèrent ainsi mieux comprendre les fonctions des gènes et leurs interactions. Nous étudions dans cet article une technique permettant d’aider à l’analyse de ces données d’expression : l’extraction de concepts sous contraintes. Pour cela, nous proposons d’extraire des fermés sou...
متن کاملExtraction de motifs temporels pour la détection dynamique de conflits ethno-politiques
Résumé. Nous présentons une réalisation en cours sur l'extraction de motifs temporels à partir de séquences d'événements dans le cadre de la détection dynamique des conflits ethno-politiques. Notre contexte d'application présente plusieurs difficultés : le phénomène que l'on cherche à modéliser est fortement variable et les données sont bruitées. Mais nous disposons d'une connaissance a priori ...
متن کامل